『情報検索 :検索エンジンの実装と評価』
https://gyazo.com/d50b021567655dcd712d1dc05c4a1a73
2020/10/30
Part 1基礎
1 イントロダクション
1.3電子テキストの取扱い
1.4テストコレクション
1.5オープンソースIRシステム
1.6さらに学習を進めるために
1.7演習問題
1.8参考文献
2 基本技術
2.1転置インデックス
2.2検索とランキング
2.3評価
2.4まとめ
2.5さらに学習を進めるために
2.6演習問題
2.7参考文献
3 トークンとターム
3.1英語
3.2文字エンコーディング
3.3Nグラム法
3.4その他のヨーロッパ言語
3.6さらに学習を進めるために
3.7演習問題
3.8参考文献
Part 2インデクシング
4.1インデックスの構成要素とライフサイクル
4.2辞書
4.3ポスティングリス
4.4インターリービング辞書とポスティングリスト
4.5インデックスの作成
4.6その他のインデックス形式
4.7まとめ
4.8さらに学習を進めるために
4.9演習問題
4.10参考文献
5 クエリ処理
5.1ランキングのためのクエリ処理
5.2軽快な実装
5.3さらに学習を進めるために
5.4演習問題
5.5参考文献
6.1データ圧縮概論
6.2シンボル的データ圧縮
6.3ポスティングリストの圧縮
6.4辞書の圧縮
6.5まとめ
6.6さらに学習を進めるために
6.7演習問題
6.8参考文献
7.1バッチの更新
7.2増分インデックスの更新
7.3ドキュメントの削除
7.4ドキュメントの変更
7.5さらに学習を進めるために
7.6演習問題
7.7参考文献
Part 3検索とランキング
8 確率的情報検索
8.1関連性のモデル化
8.2バイナリ独立モデル
8.3ロバートソン/スパルク・ジョーンズ重み付け関数
8.4ターム頻度
8.5ドキュメントの長さ: BM25
8.6適合性フィードバック
8.7ドキュメント内フィールドによる重み付け: BM25F
8.8実験による比較
8.9さらに学習を進めるために
8.10演習問題
8.11参考文献
9.1ドキュメントからのクエリ生成
9.2言語モデルと平滑化
9.3言語モデルによるランキング
9.4カルバック–ライブラー情報量
9.5ランダム性からの距離
9.6パッセージ検索とランキング
9.7実験による比較
9.8さらに学習を進めるために
9.9演習問題
9.10参考文献
10 分類とフィルタ
10.1詳細例
10.2格付け
10.3確率的格付け器
10.4線形格付け器
10.5類似性に基づいた格付け器
10.6一般化線形モデル
10.7情報理論的モデル
10.8実験による比較
10.9さらに学習を進めるために
10.10演習問題
10.11参考文献
11 融合・メタ機械学習
11.1検索結果の融合
11.2スタッキング適応フィルタ
11.3バッチ格付け器のスタッキング
11.4バギング
11.5ブースティング
11.6複数カテゴリのランキングと格付け
11.7ランキング学習
11.8さらに学習を進めるために
11.9演習問題
11.10参考文献
Part 4評価
12 有効性の評価
12.1伝統的な有効性評価
12.2テキスト検索会議(TREC)
12.3統計指標を用いた評価
12.4判断処理数の最小化
12.5新しい有効性評価
12.6さらに学習を進めるために
12.7演習問題
12.8参考文献
13 効率の評価
13.1効率の基準
13.2待ち行列理論
13.3クエリスケジューリング
13.4キャッシング
13.5さらに学習を進めるために
13.6演習問題
13.7参考文献
Part 5大規模情報検索システムの構築方法
14 並列情報検索
14.1並列クエリ処理
14.2マップレデュース
14.3さらに学習を進めるために
14.4演習問題
14.5参考文献
15 Web検索
15.1Webの構造
15.2クエリとユーザ
15.3静的ランキング
15.4動的ランキング
15.5Web検索の評価
15.6Webクローラ
15.7まとめ
15.8さらに学習を進めるために
15.9演習問題
15.10参考文献
16 XML検索
16.1XMLのエッセンス
16.2パス,ツリー,フラワー
16.3インデクシングとクエリ処
16.4ランキング検索
16.5評価
16.6さらに学習を進めるために
16.7演習問題
16.8参考文献
Part 6付録Aコンピュータの性能
A.1ディスクのシーケンシャルアクセスとランダムアクセス
A.2メモリのシーケンシャルアクセスとランダムアクセ
2A.3パイプライン処理と分岐予測
訳者あとがき
索引